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摘 要 ; 信号 检测 论 被 广泛 用 于 解释 个 体 在 不 同类 型 认 知 任务 中 的 决策 过 程 。 然 而 ， 经 典 


言 号 检测 论 的 重要 不 足 之 处 在 于 难以 进一步 解释 个 体 设 置 报告 标准 的 过 程 对 应 怎样 的 内 在 


心理 机 制 。 本 文 从 贝 叶 斯 决策 理论 的 视角 出 发 ， 深 入 探讨 了 个 体 在 信号 检测 任务 中 的 决策 


规则 。 本 文 首先 基于 贝 叶 斯 定理 ， 介 绍 了 贝 叶 斯 决策 理论 的 基本 观点 。 随 后 ， 本 文 探 讨 了 


贝 叶 斯 决策 理论 如 何 解释 理想 观察 者 的 决策 规则 ， 以 及 在 实际 的 信号 检测 任务 中 个 体 的 决 


策 结 果 与 理想 观察 者 之 间 的 偏离 。 接 下 来 ， 本 文 探讨 了 经 典 信 号 检测 论 和 贝 叶 斯 决策 理论 


在 不 等 方差 信号 检测 模型 中 的 差异 。 最 后 ， 本 文 简要 介绍 了 支持 贝 叶 斯 决策 理论 的 实证 研 


究 证 据 。 


关键 词 : 信号 检测 论 ， 贝 叶 斯 决策 理论 ， 先 验 概率 ， 似 然 函 数 ， 报告 标准 


信号 检测 论 (signal detection theory, SDT) 是 实验 心理 学 研究 中 应 用 最 为 广泛 的 计算 模型 


之 一 。 自 从 心理 学 家 John A. Swets 及 其 合作 者 首次 将 信号 检测 论 系统 性 地 引入 心理 学 领域 


以 来 (Green & Swets, 1966; Tanner & Swets, 1954)， 研 究 者 们 已 经 广泛 地 应 用 信号 检测 论 模 型 


来 解释 知觉 、 记 忆 、 推 理 等 不 同心 理 过 程 的 内 在 机 制 (Banks, 1970; Mamassian, 2016; Wixted, 


2020)。 在 心理 学 论文 数据 库 PsycArticles 和 PsycInfo F, VA “signal detection theory” 为 关键 


词 可 以 检索 出 超过 4000 篇 文献 ， 且 在 2020 至 2022 这 三 年 间 发 表 的 文献 就 达到 了 500 篇 ， 
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足以 证 明 信 和 号 检测 论 不 仅 在 心理 学 研究 的 历史 上 占有 重要 地 位 , 同时 在 今天 仍然 具有 旺盛 的 


Lt 


E 命 力 。 


在 基于 信号 检测 论 的 心理 学 实验 设计 中 , 研究 者 会 向 被 试 呈现 两 类 不 同 的 刺激 , 其 中 一 


类 刺激 被 称 为 “信号 ”(signaD)， 而 另 一 类 刺激 被 称 为 “噪音 ”Coise)。 被 试 的 任务 是 判断 哪 


些 刺 激 属 于 信号 ， 哪 些 刺激 属于 噪音 (Wickens,2001)。 比 如 ， 在 一 个 听觉 任务 中 ， 被 试听 到 


的 刺激 可 能 只 包含 白 噪音 ， 也 可 能 在 白 噪 音 的 基础 上 苔 加 了 一 个 特定 声调 的 声音 作为 信号 ; 


被 试 需要 判断 信号 在 哪些 试 次 (trial) 当 中 出 现 (Egan et al., 19$9)。 又 如 ， 在 再 认 记 忆 任 务 中 ， 


被 试 需要 首先 学 习 并 记忆 一 系列 词语 ,随后 研究 者 会 向 被 试 呈现 一 些 学 过 的 “ 旧 词 ”作为 信 


号 ， 和 一 些 没 学 过 的 “新 词 ”作为 噪音 ; 被 试 需要 判断 每 个 词语 是 新 词 还 是 旧 词 (Mickes et 


al., 2007; Wixted, 2007)。 通 常情 况 下 ， 信 和 号 检测 论 会 假设 信号 和 噪音 的 刺激 强度 分 别 符合 一 


个 正 态 分 布 , 且 信 号 分 布 的 均值 高 于 噪音 分 布 ; 信号 分 布 和 噪音 分 布 均值 之 差 被 称 为 办 别 力 


指数 (d), 它 反映 了 个 体 辨别 信号 和 品 音 的 能 力 , d' 越 高 则 个 体 的 辨别 力 越 强 (Wickens, 2001)。 


言 号 检测 论 关注 的 一 个 重要 问题 是 , 个 体 如 何 决策 哪些 刺激 属于 信号 , 哪些 刺激 属于 品 


音 。 经典 的 信号 检测 论 观点 认为 ,个 体会 直接 在 刺激 强度 的 数 轴 上 设置 报告 标准 C， 如 果 当 


前 刺激 的 强度 高 于 C， 则 个 体 判断 当前 刺激 为 信号 ， 反之 判断 为 噪音 (Wixted, 2020)。 图 1 给 


出 了 信号 检测 论 模 型 的 一 个 示例 。 该 模型 中 噪音 分 布 的 均值 为 0, 信号 分 布 的 均值 为 4 ， 两 


噪音 


eS gan BEB EBB RBBB Beas BEB BB EBB eae 


图 1 信号 检测 论 模型 示例 (图 中 的 模型 为 等 方差 信号 检测 模型 ) 
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个 分 布 的 标准 差 均 为 1， 当 某 个 刺激 的 强度 高 于 C 时 , 个 体会 将 其 判断 为 信号 ， 反之 则 判断 


为 噪音 。 在 信号 检测 任务 中 ,个 体 的 作答 结果 可 以 被 分 为 四 种 类 型 : 击 中 (将 信号 刺激 判断 


为 信号 )、 虚 报 《〈 将 噪音 刺激 判断 为 信号 六 漏 报 〈 将 信号 刺激 判断 为 噪音 ) 和 正确 拒绝 CHF 


噪音 刺激 判断 为 噪音 ) (Wickens, 2001)。 四 类 作答 结果 出 现 的 概率 由 代表 信和 号 或 噪音 的 正 态 


分 布 在 C 的 左 侧 或 右 侧 的 面积 大 小 来 表示 《〈 见 图 1 )。 


言 号 检测 论 的 优点 在 于 , 它 可 以 从 个 体 的 作答 正确 率 数 据 中 , 分 离 出 辨别 力 指数 4 和 报 


告 标准 C 这 两 个 指标 ， 使 得 研究 者 可 以 分 别 探讨 任务 难度 〈 即 由 ) 和 个 体 的 反应 偏向 〈 即 


C) 如 何 影 响 个 体 最 终 的 作答 结果 (Wickens, 2001). 然而, 经典 信号 检测 论 框 架 ( 即 直接 使 用 


C 来 反映 个 体 的 决策 判断 标准 的 信号 检测 论 模 型 ) 也 存在 一 个 重要 的 不 足 之 处 : 它 难以 深入 


= 解释 个 体 在 信号 检测 任务 中 完成 决策 的 过 程 对 应 怎样 的 内 在 心理 机 制 。 虽 然 经 典 信号 检测 论 
= 简单 地 假设 个 体会 直接 将 当前 刺激 的 强度 与 一 个 特定 的 判断 标准 C 在 数 轴 上 的 位 置 进行 比 
N 

CN í š j ; i + A ~ ` 一 vv 他 、 
O 较 ， 并 基于 比较 的 结果 来 完成 决策 ， 但 它 通常 难以 进一步 解释 个 体 为 何 会 把 报告 标准 C 设 


置 在 数 轴 上 的 特定 位 置 ， 以 及 对 于 不 同 个 体 而 言 或 在 不 同 实验 条 件 下 C 的 位 置 产生 差异 的 


内 在 原因 (Glanzer et al., 2009, 2019). 


事实 上 ， 早 在 信号 检测 论 提出 之 初 ，Swets 及 其 合作 者 就 开始 使 用 贝 叶 斯 决策 理论 


(Bayesian decision theory, BDT) 的 观点 来 解释 个 体 在 信号 检测 任务 中 的 决策 过 程 (Green & 


Swets, 1966)。 近 年 来 ， 贝 叶 斯 决策 理论 与 信号 检测 论 之 间 的 关系 开始 受到 越 来 越 多 的 研究 


者 的 重视 (Fleming & Daw, 2017; Glanzer et al., 2019; Maloney & Zhang, 2010)。 贝 叶 斯 决策 理 


论 认为 个 体会 基于 观测 到 的 当前 刺激 强度 , 通过 一 个 贝 叶 斯 推理 过 程 来 决策 当前 刺激 是 信号 


还 是 


z 


噪音 (Fleming & Daw, 2017; Maloney & Zhang, 2010; Pouget et al., 2016)。 和 经 典 信号 检 


测 论 相 比 , 贝 叶 斯 决策 理论 为 个 体 如 何在 信号 检测 任务 中 完成 决策 过 程 给 出 了 更 加 深入 的 理 


论 解 释 (Glanzer et al., 2019; Lau, 2007)。 
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本 文 将 从 贝 叶 斯 决策 理论 的 视角 , 深入 探讨 信号 检测 论 框 架 下 个 体 的 决策 规则 。 本 文 将 


首先 介绍 贝 叶 斯 决策 理论 的 基本 观点 , 即 个 体 在 信号 检测 任务 中 如 何 通过 一 个 贝 叶 斯 推理 过 


程 完成 决策 。 随后， 本 文 将 阐述 信号 检测 论 当中 的 “理想 观察 者 ”(ideal observer) 问 题 ， 并 在 


等 方差 (equal variance) 信 号 检测 模型 的 框架 下 ， 介 绍 贝 叶 斯 决策 理论 如 何 解 释 实际 研究 中 的 


被 试 与 理想 观察 者 之 间 的 偏离 。 接 下 来 ， 本 文 将 讨论 不 等 方差 (unequal variance) 的 信号 检测 


模型 ， 并 阅 述 贝 叶 斯 决策 理论 与 经 典 信 号 检测 论 在 该 模型 中 存在 的 差异 。 最后， 本文 将 介绍 


支持 贝 叶 斯 决策 理论 的 实证 研究 证 据 。 


2 ” 贝 叶 斯 决策 理论 


贝 叶 斯 决策 理论 的 基础 是 贝 叶 斯 定理 (Bayes” theorem)， 它 来 源 于 对 联合 概率 (joint 


probability) 的 计算 公式 ( 胡 传 甩 等 ,2018)。 假 设 有 两 个 事件 一 一 A FB, W AMB 同时 发 生 
的 概率 被 称 为 联合 概率 ， 记 为 P(A, B)。 联 合 概 率 的 计算 公式 可 以 被 写 为 如 下 形式 : 
P(A, B) = P(B|A)P(A) (1) 


公式 (1) 的 含义 为 : A 和 B 同时 发 生 的 概率 ， 等 于 A 发 生 的 概率 P (A) 乘 以 在 A 发 生 的 


条 件 下 B 发 生 的 概率 P(B1A)。 其 中 ，P(A) 又 被 称 为 边缘 概率 (marginalprobability)， 它 指 的 


是 在 不 考虑 其 他 事件 的 发 生 结果 的 情况 下 ， 茶 一 事件 发 生 的 概率 ; 而 P(B1A) 又 被 称 为 条 件 


概率 (conditional probability)， 它 指 的 是 在 确定 某 一 个 事件 (如 A) 己 经 发 生 的 条 件 下 ， 另 一 


个 事件 (如 B) 发 生 的 概率 。 实 际 上 ，A 和 B 同时 发 生 的 联合 概率 ， 还 可 以 被 写 为 另 一 种 形 


式 ， 即 等 于 B 发 生 的 边缘 概率 P (B) 乘 以 在 B 发 生 的 条 件 下 A 发 生 的 条 件 概 率 P (A |B): 


P(A, B) = P(A|B)P(B) (2) 


基于 以 上 的 公式 (1) 和 (2)， 可 以 得 出 如 下 的 公式 (3): 


P(A|B)P(B) = P(BIA)P(A) (3) 


公式 (3) 通 常会 被 写 为 如 下 的 形式 : 


P(BIA)P(A) 


PAB) =— som 


(4) 


公式 (4) 即 为 贝 叶 斯 定理 的 一 般 形式 。 贝 叶 斯 定理 的 提出 起 初 只 是 为 了 刻画 两 个 事件 的 


边缘 概率 和 条 件 概率 之 间 满 足 的 数学 关系 。 然 而 ,心理 学 家 很 快意 识 到 ， 贝 叶 斯 定理 可 以 被 


用 来 刻画 人 类 的 推理 与 决策 过 程 (Kersten et al., 2004; Lau, 2007; Wickens, 2001)。 比 如 ， 公 式 


(4) 可 以 被 用 来 解释 个 体 如 何 通 过 对 事件 B 进行 观测 ， 来 推理 事件 A 的 发 生 概 率 。 此 时 ， 公 


式 (4) 中 的 P(A) 被 称 为 先 验 概率 (prior probability)， 它 指 的 是 在 观测 到 事件 B 之 前 , 个 体 对 于 


事件 A 发 生 概率 的 先 验 认识 。P (A | B) 被 称 为 后 验 概率 (posterior probability)， 它 反映 了 个 体 


{hin 


在 观测 到 事件 B 的 发 生 结果 之 后 对 事件 A 发 生 概率 的 认识 。 个 体 在 贝 叶 斯 推理 过 程 中 ， 会 


根据 对 事件 B 的 观测 结果 来 更 新 自身 对 事件 A 发 生 概率 的 认识 , 即 从 P(A) 更 新 为 P(A|B)。 


另 一 方面 ，P (B | A) 被 称 为 似 然 函数 (likelihood function)， 它 反映 了 在 给 定 事件 A 的 情况 下 ， 


事件 B 发 生 的 可 能 性 。 在 个 体 对 事件 A 发 生 概率 进行 更 新 的 过 程 中 ， 先 验 概率 和 似 然 函 数 


mn 


都 起 到 了 重要 的 作用 : 一 方面 , 当 A 发 生 的 先 验 概 率 值 越 高 时 ， 其 后 验 概 率 值 也 会 越 高 ; 另 


一 方面 ， 在 假定 事件 A 发 生 的 情况 下 ， 如 果 事 件 B 发 生 的 概率 越 高 〈 即 似 然 函数 值 越 大 )， 


则 个 体 在 观测 到 事件 B 之 后 也 会 认为 事件 A 成 立 的 后 验 概率 越 高 。 


根据 贝 叶 斯 决策 理论 的 观点 , 在 信号 检测 任务 中 , 个 体会 观测 到 每 个 刺激 的 强度 〈 记 为 


x), HÆF x 的 值 来 完成 一 个 贝 叶 斯 推理 过 程 ， 以 推理 当前 刺激 属于 信号 或 噪音 的 后 验 概率 


(Burgess, 1985; Fleming & Daw, 2017; Wickens, 2001)。 下 面 的 公式 给 出 了 个 体 如 何 基 于 刺激 


强度 x 对 当前 刺激 属于 信号 〈 记 为 $) 的 概率 进行 更 新 : 


P(x|S)P(S) 
P(x) 


公式 (5) 意 味 着 , 在 观测 到 当前 刺激 之 前 , 个 体 对 当前 刺激 属于 信号 的 概率 存在 一 个 先 验 


P(S|x) = (5) 


的 认识 ， 反 了 映 为 先 验 概率 P (S)。 而 在 观测 到 当前 刺激 的 强度 x 之 后 ， 被 试 将 当前 刺激 属于 


信号 的 概率 更 新 为 后 验 概率 P (S | x)。 同 理 ， 个 体 基于 刺激 强度 x 对 当前 刺激 属于 噪音 《〈 记 


FIN) 的 概率 进行 更 新 的 过 程 可 以 用 如 下 公式 表示 : 


P(x|N)P(N) 
P(x) 


贝 叶 斯 决策 理论 认为 , 个 体会 基于 当前 刺激 属于 信号 或 噪音 的 后 验 概率 , 来 决定 应 当 把 


P(N|x) = (6) 


LIK 


前 刺激 判断 为 信号 还 是 噪音 。 如 果 刺 激 属于 信号 的 后 验 概 率 大 于 其 属于 噪音 的 后 验 概 率 ， 


则 个 体 就 会 把 当前 刺激 判断 为 信号 ， 反 之 则 判断 为 噪音 (Burgess, 1985; Fleming & Daw, 2017; 


Lau, 2007)。 由 于 刺激 属于 信号 和 噪音 的 后 验 概 率 之 和 为 1， 因 此 个 体会 把 P (S | x) = 0.5 作 


为 判断 标准 : 如 果 刺 激 属于 信号 的 后 验 概率 大 于 0.5 则 判断 当前 刺激 为 信号 , 而 如 果 小 于 0.5 


则 判断 刺激 为 噪音 。 


在 公式 (5) 和 (6) 中 ， 观 测 到 刺激 强度 x 的 边缘 概率 P (x) 是 相等 的 。 具 体 而 言 ，P (x) 的 计 


算 方法 是 ， 根 据 刺激 属于 信号 和 品 音 的 先 验 概率 一 一 P (S) 与 P(N)， 对 给 定 当前 刺激 是 信号 


或 噪音 的 条 件 下 观测 到 x 的 概率 ( 似 然 函数 ) 一 一 P(x | S) 与 P(x|N)， 进 行 加 权 平 均 : 


P(x) = P(x|S)P(S) + P(x|N)P(N) (7) 


可 以 通过 将 公式 (5) 与 公式 (6) 相 除 ， 消 去 P Co 项 ， 得 出 下 面 的 公式 : 


P(SIx) _ PIS) P(S) 
PCNIx) PCxIN) PCN) 


公式 (8) 意 味 着 ， 贝 叶 斯 决策 过 程 可 以 被 看 作 是 个 体 基于 后 验 概率 的 比值 进行 决策 的 过 


(8) 


程 : 如 果 刺 激 属于 信号 和 噪音 的 后 验 概率 比 P(S |x) /PN|2a 大 于 1， 则 被 试 会 把 当前 刺激 


判断 为 信号 ， 反 之 则 判断 为 噪音 。 根 据 贝 叶 斯 定理 ， 后 验 概 率 比 值 是 由 刺激 强度 x 在 信号 和 


噪音 成 立 的 条 件 下 的 似 然 函 数 比 值 P (x|S)/P(x|N)， 以 及 信号 和 噪音 的 先 验 概率 比值 P(S) 


/P (NN) 共同 决定 的 。 


由 于 在 信号 或 噪音 成 立 的 条 件 下 , 刺激 强度 x 分 别 满足 一 个 概率 分 布 (通常 假设 为 正 态 


分 布 )， 因 此 x 在 信号 或 噪音 成 立 条 件 下 的 似 然 函数 反 映 了 当 刺 激 是 信号 或 噪音 时 观测 到 的 


205.00114v2 


刺激 强度 为 x 的 相对 概率 ， 其 等 价 于 x 在 信号 或 噪音 分 布 中 出 现 的 概率 密度 〈 即 正 态 分 布 中 


x 所 在 位 置 对 应 的 纵 坐标 的 值 )。 当 刺激 强度 x 在 信号 分 布下 出 现 的 概率 密度 P (x | S) 越 大 ， 


或 在 噪音 分 布下 出 现 的 概率 密度 P(x | N) 越 小 时 ， 个 体 越 倾向 于 将 当前 刺激 判断 为 信号 ， 反 


之 则 更 倾向 于 判断 为 噪音 。 需 要 注意 的 是 ,个 体 在 完成 贝 叶 斯 推理 的 过 程 中 ， 可 能 并 不 知道 


信号 和 噪音 分 布 的 真实 形态 。 比 如 , 个 体 可 能 并 不 知道 真实 的 信号 与 噪音 分 布 的 均值 和 标准 


差分 别 等 于 多 少 (Lau, 2007)。 为 了 完成 贝 叶 斯 推理 过 程 ， 个 体 必 须 主观 推测 信号 和 噪音 分 布 


的 形态 ， 并 据 此 来 估计 当前 刺激 的 强度 x 在 信号 和 噪音 分 布 中 出 现 的 似 然 函 数 (Lau, 2007)。 


在 一 些 情况 下 , 个 体 对 刺激 属于 信号 还 是 噪音 可 能 不 存在 先 验 的 偏好 。 比 如 ,被 试 在 参 


加 一 个 信号 检测 实验 任务 之 前 , 可 能 对 电脑 屏幕 上 出 现 的 刺激 是 信号 还 是 噪音 并 没有 先 验 的 


偏向 , 而 是 简单 地 认为 二 者 是 等 可 能 的 ,此 时 可 以 简单 假设 信号 和 嗓音 成 立 的 先 验 概 率 相等 ， 


即 P(S)=P(N)=0.5。 这 种 情况 下 的 后 验 概率 比值 就 等 于 似 然 函 数 的 比值 ， 因 此 贝 叶 斯 决策 


的 结果 完全 由 似 然 函数 的 值 来 决定 。 然而, 先 验 概率 并 不 一 定 始 终 等 于 0.5 (Wickens, 2001). 


比如 , 一 些 个 体 对 信号 和 品 音 出 现 的 先 验 概 率 可 能 上 共有 一 定 的 主观 偏好 , 即 可 能 偏向 于 认为 


信号 或 噪音 其 中 之 一 更 可 能 出 现 。 此 时 , 基于 后 验 概率 比值 的 贝 叶 斯 决策 过 程 不 仅 受 到 似 然 


函数 比值 的 影响 ,也 受到 先 验 概 率 比 值 的 影响 ， 当 个 体 认 为 信号 成 立 的 先 验 概 率 越 大 ， 或 噪 


音 成 立 的 先 验 概率 越 小 时 , 就 越 倾向 于 把 当前 刺激 判断 为 信号 , 反之 则 越 倾向 于 判断 为 噪音 。 


根据 贝 叶 斯 决策 理论 的 观点 ,个 体 在 贝 叶 斯 推理 过 程 中 使 用 的 似 然 函数 值 和 先 验 概率 值 ， 


均 来 自 于 个 体 自身 的 主观 估计 。 那 么 ， 当 个 体 主 观 估计 的 似 然 函 数 和 先 验 概率 等 于 多 少时 ， 


最 终 给 出 的 决策 结果 是 最 理想 的 ? 当 似 然 函 数 和 先 验 概 率 的 主观 估计 值 发 生变 化 时 ,个体 的 


决策 过 程 又 会 受到 怎样 的 影响 ? 为 ] 


H 


答 上 述 问题 , 本 文 接 下 来 将 从 信号 检测 任务 中 的 “ 理 


想 观 察 者 ”视角 出 发 ,在 贝 叶 斯 决策 理论 的 框架 下 进一步 探讨 个 体 何 时 会 给 出 最 理想 的 决 策 ， 


以 及 如 何 解释 实际 研究 中 被 试 的 决策 结果 与 理想 观察 者 之 间 的 偏离 。 
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3 ”理想 观察 者 


根据 经 典 信号 检测 论 的 观点 , 个 体会 在 刺激 强度 的 数 轴 上 设置 一 个 报告 标准 C， 并 通过 


比较 当前 刺激 的 强度 x 与 C 在 数 轴 上 的 位 置 ， 来 决定 当前 刺激 是 信号 还 是 噪音 。 个 体 的 作 


答 结果 可 以 被 分 为 击 中 、 虚 报 、 


属 报 和 正确 拒绝 四 种 类 型 ， 其 中 击 中 (将 信号 刺激 判断 为 信 


号 ) 和 正确 拒绝 (将 噪音 刺激 判断 为 噪音 ) 视 为 正确 作答 , 而 虚报 (将 噪音 刺激 判断 为 信号 ) 


和 漏 报 〈 将 信号 刺激 判断 为 噪音 ) 视 为 错误 作答 。 那 么 ， 一 个 有 趣 的 问题 是 ， 当 报告 标准 C 


设置 在 哪里 时 , 个 体 作答 的 正确 率 最 大 ? 在 信号 检测 论 框架 下 , 通过 设置 最 合适 的 报告 标准 


使 得 作答 正确 率 最 大 的 个 体 ， 被 称 为 理想 观察 者 (ideal observer)(Wickens, 2001). 


为 了 计算 出 理想 观察 者 会 把 报告 标准 C 设置 在 怎样 的 位 置 ， 首 先 需 要 求 出 C 值 的 变化 


如 何 影响 作答 正确 率 。 这 里 以 


图 1 中 呈现 的 信号 检测 论 模 型 为 例 。 在 图 1 所 示 的 模型 中 ，, 信 


布 具有 相等 的 方差 (二 者 均等 于 1), 该 类 模型 又 被 称 为 等 方差 (equal variance) 


信号 检测 模型 (Wickens, 2001)。 根 据 图 1 可 知 ， 当 实验 中 呈现 的 刺激 为 信号 时 ， 作 答 正 确 率 


( 即 击 中 率 ，hit rate，HR) 等 于 信号 分 布下 报告 标准 C 右 侧 的 面积 。 有 基体 计算 公式 为 : 


HR=1-—®(Clp = d',o = 1) (9) 


上 式 中 ，@ (C | mu go) 代表 均值 为 上 、 标 准 差 为 o 的 正 态 分 布 的 累积 分 布 函数 ， 即 等 价 于 


该 正 态 分 布 位 于 C 左 侧 的 曲线 下 方面 积 。 


司 理 ， 当 实验 中 呈现 的 刺激 为 噪音 时 ， 作 答 正 确 率 


( 即 正确 拒绝 率 ，correct rejection rate, CRR) 等 于 噪音 分 布下 报告 标准 C 左 侧 的 面积 : 


假设 在 信号 检测 实验 任务 中 ， 


以 与 个 体 在 贝 叶 


斯 决策 过 程 ' 


CRR = (Clu = 0,0 = 1) (10) 


为 PIN)。 字 母 t 的 意思 是 ,上述 概 率 代 表 了 


使 用 的 主观 2 


言 号 刺激 出 现 的 可 能 性 为 P (SD， 品 音 刺激 出 现 的 可 能 性 


童 号 和 噪音 刺激 在 实验 中 出 现 的 真实 (true) 概 率 ， 


E 验 概率 相 区 分 。 据 此 可 以 求 出 总 体 的 作答 正确 率 


Prorrect : 


Peorrect = P(S+) : HR + P(N;) CRR = 
P(S;) [1 — (Clu = d',o = 1)] + P(N) (Clu = 0,0 = 1) (11) 


为 了 求 出 C 值 等 于 多 少时 Peorrect 最 大 ， 可 以 先 求 出 Peorrect 的 一 阶 导 数 : 


dP.iorrec 
EA = PN): $C = 0,0 = 1) — PUS,)@(Clu = d',o = 1) (12) 


公式 (12) 中 , (C| 0) 代表 在 均值 为 hn、 标 准 差 为 o 的 正 态 分 布 中 ， 刺 激 强度 等 于 C 时 


的 概率 密度 。 理想 观察 者 的 报告 标准 Cideat 应 当 设 置 在 令 Peorrect 的 一 阶 导数 为 0 的 位 置 ， Ep 


满足 如 下 的 公式 (13): 
P(N:) pCiaeailk =0,0=1)— P(Se)P(Ciaeailk =d',a=1)=0 (13) 


当 个 体 把 强度 高 于 Cida 的 刺激 全 部 判断 为 信号 , 而 把 强度 低 于 Cida 的 刺激 全 部 判断 为 


O 噪音 时 ， 个 体 的 作答 正确 率 达 到 最 大 (Wickens,2001)。 根 据 正 态 分 布 的 概率 密度 函数 ， 可 以 


进一步 求 出 Cidea 在 刺激 强度 的 数 轴 上 的 位 置 : 


1 _Cidear- a’)? 


$(Cideailu = d',o = 1) = aa a (14) 
= — ay 1 Sideat* 
= $(Ciaealu = 0,0 = 1) = Ta 2 (15) 
a d 1 [P(N,) 
a Cideal = 7 + 7 n Ea (16) 


在 等 方差 信号 检测 横 型 中 ， 当 信号 和 噪音 在 实验 任务 中 出 现 的 概率 相同 ， 即 P (S) = P 


N)=0.5 t, C 的 位 置 恰好 等 于 d7/2， 即 理想 观察 者 会 把 报告 标准 设置 在 信号 分 布 均值 和 品 


音 分 布 均值 的 正中 间 位 置 。 换言之 ,理想 观察 者 设置 的 报告 标准 正好 处 在 信号 分 布 和 噪音 分 


布 交叉 的 位 置 (Wickens, 2001). 


PE ROR, 本 文 将 介绍 如 何 从 贝 叶 斯 决策 理论 的 角度 来 理解 理想 观察 者 的 决策 规则 。 公式 


式 : 


= PCiaealt = Wo = DPS) 
Pp(Ciaeailk = 0,0 = 1)P(N:) 


不 难看 出 ， 公 式 (17) 与 反映 贝 叶 斯 决策 过 程 的 公式 (8) 非 常 相似 。 在 公式 (17) 中 ， 信 号 和 


(13) 又 可 以 被 写成 如 下 的 


SS 


(17) 
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用 的 先 验 概率 比值 ; 而 在 公式 (17) 中 ， 当 刺激 强度 等 于 


噪音 在 实验 任务 中 出 现 的 真实 概率 的 比值 P (SD /P (Ni)， 类 似 于 个 体 在 贝 叶 斯 决策 过 程 中 使 


Cideat 时 信号 和 噪音 分 布 中 的 概率 密度 


比值 @ (Cideal | u= g’, o= 1) / @ (Cideal | u= 0, 0= 1), 也 类 似 于 贝 叶 斯 决策 过 程 中 的 似 然 函 数 


比值 。 事实 上 ， 贝 叶 斯 决策 理论 指出 ， 当 个 体 完全 清楚 信号 和 品 音 出 现 的 客观 先 验 概率 以 及 


信号 和 噪音 分 布 的 真实 形态 〈 即 真实 的 似 然 函 数值 ) 时 , 采用 贝 叶 斯 决策 机 制 可 以 保证 个 体 


成 为 理想 观察 者 ， 即 能 够 使 得 个 体 的 作答 正确 率 最 大 (Burgess, 198$)。 有 具体 而 言 ， 结 合 公式 


(9) 与 公式 (17) 可 知 ， 当 刺激 强度 恰好 等 于 Cia 时 ， 后 验 概 率 的 比值 《 即 信号 和 噪音 条 件 下 


似 然 函数 与 先 验 概率 乘积 的 比值 ) 等 于 1。 而 当 刺 激 强度 大 于 Ciae 时 ， 后 验 概 率 的 比值 大 于 


1， 此 时 个 体会 把 当前 刺激 判断 为 信号 ， 当 刺激 强度 小 于 Cia 时 ， 后 验 概率 的 比值 小 于 1， 


此 时 个 体会 把 当前 刺激 判断 为 噪音 。 上 述 基 于 贝 叶 斯 推理 过 程 的 决策 规则 , 与 经 典 信 号 检测 


论 框架 下 理想 观察 者 的 决策 规则 完全 相同 。 


然而 , 针对 实际 研究 的 数据 分 析 结 果 表 明 , 虽然 真实 被 试 设置 的 报告 标准 与 理想 观察 者 


近似 (Knill, 1998; Legge et al., 2002; Stretch & Wixted, 19 


98)， 但 被 试 通常 不 会 把 报告 标准 恰好 


设置 在 公式 (16) 给 出 的 Ciaea 的 位 置 ， 这 意味 着 被 试 的 决策 规则 与 理想 观察 者 仍然 存在 一 定 


的 偏离 (Lau, 2007; Wickens, 2001)。 根 据 贝 叶 斯 决策 到 


E 论 ， 真 实 被 试 与 理想 观察 者 的 偏离 可 


(A) 


主观 估计 


图 2 个 体 对 先 验 概率 和 似 然 函 数 的 主观 估计 与 客观 真实 值 之 间 的 偏差 示例 
10 
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能 由 两 种 不 同 的 原因 造成 。 第 一 种 原因 是 被 试 对 信号 和 噪音 出 现 的 先 验 概 率 的 估计 与 二 者 出 


现 的 实际 概率 不 相同 。 图 2A 给 出 了 一 个 示例 : 在 实际 的 实验 任务 中 ， 信 号 和 噪音 出 现 的 客 


观 概率 相等 , 但 被 试 主观 认为 信号 出 现 的 先 验 概率 大 于 噪音 的 先 验 概率 。 基于 贝 叶 斯 决策 理 


论 的 观点 , 被 试 此 时 会 根据 自身 对 先 验 概率 的 主观 估计 , 把 报告 标准 设置 在 信号 分 布 和 噪音 


分 布 均值 的 中 间 靠 左 的 位 置 , 以 保证 作答 正确 率 最 大 。 但 由 于 被 试 主观 估计 的 先 验 概率 与 信 


号 和 品 音 出 现 的 客观 概率 不 同 , 因此 被 试 设置 的 报告 标准 在 实际 的 信号 和 噪音 分 布 上 就 会 与 


态 不 同 ， 进 而 造成 对 似 然 函 数 的 主观 估计 出 现 偏 差 。 在 


理想 观察 者 存在 偏离 ,第 二 种 原因 是 被 试 对 信号 或 噪音 分 布 形态 的 主观 估计 与 客观 分 布 的 形 


图 2B 的 示例 中 ， 被 试 对 噪音 分 布 均 


值 的 主观 估计 与 其 真实 值 相等 ， 但 是 对 信号 分 布 均值 的 主观 估计 要 大 于 信号 分 布 的 实际 均 


值 。 在 这 种 情况 下 ， 被 试 会 基于 贝 叶 斯 推理 的 结果 ,把 报告 标准 设置 在 信号 和 噪音 分 布 均值 


的 主观 估计 值 的 中 点 。 然而 , 被 试 对 信号 分 布 均值 的 主观 估计 偏差 会 导致 设置 的 报告 标准 偏 


离 实 际 分 布 上 的 理想 标准 (Lau, 2007; Wickens, 2001)。 因 此 ， 和 经 典 信 号 检测 论 相 比 ， 贝 叶 斯 


决策 理论 进一步 地 解释 了 为 何 个 体 在 信号 检测 任务 中 会 


Ht 


其 与 个 体 对 信号 和 噪音 的 出 现 概 率 及 分 布 形 态 的 主观 估 


把 报告 标准 设置 在 特定 的 位 置 , 并 将 


计 紧 密 联系 了 起 来 。 


以 上 结论 都 是 基于 图 1 所 示 的 等 方差 信号 检测 模型 推导 得 出 的 。 在 等 方差 信号 检测 模 


型 中 ,虽然 和 经 典 信号 检测 论 相 比 ， 贝 叶 斯 决策 理论 可 以 对 个 体 的 决策 过 程 给 出 更 加 深入 的 


ie 


概率 和 似 然 函数 的 主观 估计 可 能 与 其 客观 真实 值 存 在 差 


分 布 的 方差 相等 , 基于 经 典 信号 检测 论 和 贝 叶 斯 决策 理论 得 出 的 决策 过 程 就 会 在 数学 上 具有 


论 解释 ， 但 是 二 者 在 数学 上 是 等 价 的 。 共 体 而 言 ， 虽 然 根据 贝 叶 斯 决策 理论 ， 个 体 对 先 验 


异 , 但 只 要 个 体 主观 认为 信号 和 噪音 


相等 的 形式 : 个 体会 在 刺激 强度 x 高 于 某 一 报告 标准 C 时 将 刺激 判断 为 信号 , 而 在 x 低 于 C 


时 将 刺激 判断 为 噪音 (Glanzer et al., 2009, 2019; Wickens, 


务 中 ， 信 号 和 噪音 分 布 的 方差 并 不 会 始终 相等 ， 该 类 模 


2001)。 然 而 ， 在 实际 的 信号 检测 任 


型 被 称 为 不 等 方差 (unequal variance) 
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言 写 检测 模型 (Mickes et al., 2007)。 在 这 种 情况 下 ， 经 典 信 号 检测 论 与 贝 叶 斯 决策 理论 之 间 


的 关系 会 变 得 更 加 复杂 。 BE POR, 本文 将 介绍 经 典 信号 检测 论 与 贝 叶 斯 决策 理论 在 不 等 方差 


言 号 检测 模型 中 存在 怎样 的 差异 。 


4 ”不 等 方差 信号 检测 模型 


在 信号 检测 论 模型 中 , 为 了 简化 模型 假设 , 研究 者 经 常 假设 信号 和 噪音 分 布 具 有 相等 的 


方差 (标准 差 )。 然 而 ， 在 实际 研究 中 ， 这 一 假设 并 非 始终 成 并 (Green & Swets, 1966; Wixted, 


2020)。 比 如 ， 在 前 文 介绍 过 的 再 认 记 忆 任 务 中 , 研究 者 们 发 现 ， 和 “新 词 ” 代 表 的 噪音 分 布 


相 比 ,“ 旧 词 ”代表 的 信号 分 布 具有 显著 更 大 的 标准 差 ， 且 信号 和 噪音 分 布 的 标准 差 比值 通 


常 在 1.25:1 左右 (Mickes et al., 2007; Rotello, 2017)。Wixted (2007) 提 出 了 一 种 假设 来 解释 有 


H 


认 记 忆 任务 中 信和 号 分 布 方差 更 大 的 原因 : 与 新 词 相 比 , 旧 词 之 所 以 在 再 认 记忆 任务 中 具有 更 


高 的 刺激 强度 , 是 由 于 个 体 对 这 些 旧 词 在 学 习 阶段 进行 了 一 定 程度 的 学 习 与 记忆 ; MAAS 


个 体 对 所 有 旧 词 的 学 习 程 度 均 相 等 时 ,信号 分 布 的 方差 才能 与 噪音 分 布 保持 一 致 .但 实际 上 ， 


个 体 对 每 个 旧 词 的 学 习 程 度 必然 不 是 完全 相等 的 , 不 同 旧 词 的 学 习 程 度 之 间 的 变异 会 导致 信 


号 分 布 的 方差 显著 大 于 噪音 分 布 。 因 此 ， 等 方差 信号 检测 模型 虽然 具有 简单 的 理论 假设 , 但 


可 能 对 信号 检测 任务 给 出 了 过 于 简化 的 描述 ; 而 不 等 方差 信号 检测 模型 也 许 能 够 更 好 地 反映 


个 体 在 实际 任务 中 完成 的 信号 检测 过 程 。 


值得 注意 的 是 , 并非 所 有 的 信号 检测 任务 都 必须 使 用 不 等 方差 信号 检测 模型 来 描述 。 比 


如 ， 在 二 选 一 迫 选任 务 (2 alternative forced choice, 2AFC) 范 式 中 ， 屏 幕 上 每 次 会 同时 呈现 一 


个 信号 刺激 (如 旧 词 》 和 一 个 噪音 刺激 (如 新 词 )， 被 试 需要 从 两 个 刺激 中 准确 地 选 出 信号 


刺激 。 即 使 信号 和 噪音 分 布 的 方差 不 相等 ，2AFC 任务 的 信号 检测 过 程 也 能 够 使 用 等 方差 信 


号 检测 模型 来 定量 刻画 (Wickens, 2001)。 由 于 与 本 文 主题 不 直接 相关 ， 因 此 本 文 不 对 2AFC 
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$ 
> 


任务 下 的 信号 检测 论 模型 进行 进 绍 。 感 兴趣 的 读者 可 以 阅读 已 有 文献 中 对 2AFC 任务 


的 论述 (Macmillan & Creelman, 2004; Wickens, 2001)。 


下 面 , 本 文 将 介绍 在 不 等 方差 信号 检测 模型 的 框架 下 , 个 体 如 何 根据 贝 叶 斯 决策 理论 来 


完成 决策 过 程 。 图 3 给 出 了 不 等 方差 信号 检测 模型 的 示例 。 与 图 1 相似 ,图 3 中 噪音 分 布 的 


均值 为 0， 信 号 分 布 的 均值 为 a。 然而 ， 与 图 1 不 同 的 是 ， 图 3 中 噪音 分 布 的 标准 差 on 等 


于 1， 而 信号 分 布 的 标准 差 cs 与 1 并 不 相等 (图 3 中 假设 cs 大 于 1， 即 与 再 认 记 忆 任 务 中 


的 情况 相同 )。 为 了 简化 贝 叶 斯 推理 过 程 ， 这 里 假设 信号 和 噪音 出 现 的 真实 概率 均 为 0.5, H 


个 体 完 全 清楚 信号 和 噪音 的 先 验 概 率 及 似 然 函 数 。 由 于 信号 和 噪音 出 现 的 先 验 概 率 相 等 , 因 


此 个 体 的 决策 结果 完全 依赖 于 当前 刺激 的 强度 x 在 信号 和 噪音 分 布 中 的 似 然 函数 的 比值 : 根 


据 公式 (8)， 当 似 然 函数 的 比值 大 于 1 时 ， 个 体会 将 当前 刺激 判断 为 信号 ， 反 之 则 判断 为 噪 


音 。 然 而 ,根据 图 3 可 知 ， 在 不 等 方差 信号 检测 模型 中 ， 信 和 号 分 布 和 噪音 分 布 存在 两 个 不 同 


位 置 的 交叉 点 (C1 和 C2)。 当 x 小 于 Ci 或 大 于 Cs 时 , x 在 信号 分 布 中 的 概率 密度 高 于 噪音 


噪音 : 
: 言 号 
> 
;__°s 5 
C, 0 C, d 


图 3 不 等 方差 信号 检测 模型 示例 


分 布 ， 因 此 被 试 会 把 当前 刺激 判断 为 信号 ;而 当 * 处 在 Cy 和 Co 之 间 时 ，x 在 噪音 分 布 中 的 


概率 密度 更 高 ， 被 试 会 把 当前 刺激 判断 为 噪音 。 换 言 之 ， 信 号 和 噪音 分 布 的 似 然 函数 的 一 个 


特定 比值 ， 在 刺激 强度 的 数 轴 上 对 应 两 个 不 同 的 报告 标准 。 


Glanzer 等 人 (2009) 通 过 严密 的 数学 推导 , 给 出 了 在 不 等 方差 信号 检测 模型 中 , 似 然 函数 
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比值 与 刺激 强度 数 轴 上 的 报告 标准 C 之 间 的 对 应 关系 。Glanzer 等 人 首先 计算 了 当 刺 激 强 度 


SEF CIN, 信号 和 噪音 分 布 中 似 然 函数 的 比值 , 随后 对 似 然 函数 比值 取 自 然 对 数 ( 记 为 入 ): 


_, [eClu = d',o = o5) 
isn aeeoe = 


由 于 对 数 函数 是 单调 递增 的 ， 因 此 当 入 取 到 其 最 大 值 〈 或 最 小 值 ) 时 ， 似 然 函数 的 比值 


也 应 当 能 够 取 到 最 大 值 〈 或 最 小 值 )。 进 一 步 的 计算 结果 表明 (Glanzeretal.,2009)， 和 与 刺激 


强度 数 轴 上 的 报告 标准 C 之 间 满 足 二 次 函数 关系 〈 见 图 4)。 当 信和 号 分 布 的 标准 差 cs 大 于 1 


W, ARME GWAA); 而 当 os 小 于 1 时 ,入 有 最 大 值 ( 记 为 入)。 当 且 仪 当 入 等 于 入 * 


时 ,刺激 强度 数 轴 上 存在 唯一 的 报告 标准 与 其 对 应 ( 记 为 C*); 而 当 入 不 等 于 和 时, 每 一 个 


入 值 都 对 应 两 个 不 同 的 报告 标准 。 当 入 等 于 0《 即 似 然 函数 比值 为 1) 时 ， 对 应 的 两 个 报告 


标准 Ci 和 Co 将 整个 刺激 强度 数 轴 分 为 三 个 部 分 。 如 果 os 大 于 1， 则 个 体会 将 C1 和 Co 中 间 


的 部 分 判断 为 噪音 ， 而 将 两 侧 的 部 分 判断 为 信号 ; 如 果 cs 小 于 工 则 相反 。 


A 


“aama 


ere 
图 4 不 等 方差 信号 检测 模型 中 入 与 C 的 关系 

男 一 方面 , 经典 信号 检测 论 认 为 ， 即 使 在 不 等 方差 信号 检测 模型 中 ,个 体 仍 然 只 会 简单 
地 设置 一 个 报告 标准 C， 并 当 刺 激 强 度 x 高 于 C 时 将 刺激 判断 为 信号 ， 反 之 则 判断 为 噪音 


(Mickes et al., 2007; Wickens, 2001)。 因 此 ， 经 典 信号 检测 论 和 贝 叶 斯 决策 理论 为 不 等 方差 信 


号 检测 模型 中 的 决策 机 制 给 出 了 不 同 的 预测 , 个 体 根据 两 种 理论 给 出 的 决策 结果 也 不 再 完全 
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等 价 〈 这 一 点 与 等 方差 信号 检测 模型 有 别 )。 


经 典 信号 检测 论 和 贝 叶 斯 决策 理论 在 不 等 方差 信号 检测 模型 中 存在 的 差异 可 以 从 操作 


者 特性 曲线 (receiver operating characteristic curve, ROC curve) 中 体现 出 来 。ROC 曲线 指 的 是 


在 保持 信号 和 噪音 的 客观 分 布 形态 不 变 的 基础 上 ， 反 映 击 中 率 (HR) 和 虚报 率 (false alarm rate, 


FAR) 之 间 关 系 的 曲线 (Wickens, 2001)。 在 经 典 信号 检测 论 框架 下 ,通过 改变 报告 标准 C 的 位 


置 “如 设置 宽松 或 严格 的 报告 标准 )， 可 以 同时 改变 击 中 率 和 虚报 率 的 值 。 而 在 贝 叶 斯 决策 


理论 框架 下 (假设 个 体 完全 清楚 先 验 概率 和 似 然 函数 的 真实 值 )， 可 以 通过 改变 信号 和 噪音 


刺激 出 现 概率 的 方式 来 影响 先 验 概率 ,进而 影响 后 验 概 率 比 值 等 于 1 时 的 似 然 函 数 比 值 ( 即 


EL 


影响 和 的 临界 值 ); A 的 临界 值 对 应 的 报告 标准 的 位 置 也 会 随 之 发 生变 化 ， 进 而 改变 击 中 率 


和 虚报 率 。 将 所 有 可 能 的 击 中 率 和 虚报 率 配 对 绘制 在 图 上 ， 以 虚报 率 为 横 坐 标 ， 击 中 率 为 纵 


坐标 ， 即 可 得 到 ROC 曲线 。 


企 等 方差 信号 检测 模型 中 , 无 论 个 体 基 于 经 典 信 号 检测 论 还 是 贝 叶 斯 决策 理论 来 完成 决 


策 过 程 〈 二 者 在 数学 上 是 等 价 的 )， 只 要 辨别 力 指数 d 的 值 大 于 0，ROC 曲线 就 会 始终 处 在 


对 角 线 上 方 ， 即 意味 着 击 中 率 始终 高 于 虚报 率 ; 当 PIERA, ROC 曲线 下 的 面积 越 大 


COLE SA 的 示例 )。 但 是 ， 在 不 等 方差 信号 检测 模型 中 ， 如 果 个 体 基 于 经 典 信号 检测 论 给 


出 的 决策 机 制 来 完成 决策 过 程 ， 则 就 算 4 的 值 大 于 0，ROC 曲线 也 会 有 一 部 分 处 在 对 角 线 


下 方 。 比 如 , 当 信 号 分 布 标准 差 cs 大 于 1 时 , 在 击 中 率 和 虚报 率 都 非常 接近 于 1 的 情况 下 ， 


击 中 率 会 小 于 虚报 率 ( 见 图 5B); 而 当 os 小 于 1 时 ， 则 在 击 中 率 和 虚报 率 都 接近 于 0 的 情 


况 下 ， 击 中 率 小 于 虚报 率 〈 见 图 50). 与 之 相对 ， 如 果 个 体 基 于 贝 叶 斯 决策 理论 来 完成 决策 


过 程 , 则 即使 在 不 等 方差 信号 检测 模型 中 , ROC 曲线 也 会 始终 处 在 对 角 线 上 方 ( 见 图 5D); 


这 一 结论 可 以 在 数学 上 得 到 严格 的 证 明 (Wickens, 2001)。 
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等 方差 模型 (B) 经 典 信号 检测 论 (os > 1) 


HR 


1 


”一 由 =0.$,cs=1.5 


-- d=1,0,=2 

a FAR 
0 
(C) 经典 信 号 检测 论 (os < 1) (D) 贝 叶 斯 决策 理论 
HR 
ta — oa: oe 7 a ani ai L a ; 
== d=0.5,6,=0.5 == d=0.5,0,=0.5 
2 FAR FAR 
0 1 


图 5 ROC 曲线 示例 


经 典 信号 检测 论 和 贝 叶 斯 决策 理论 之 间 的 差异 可 以 在 zROC 曲线 上 得 到 更 加 直观 的 体 


现 (Macmillan & Creelman, 2004). 所谓 zROC 曲线 , 指 的 是 首先 利用 下 面 的 公式 将 击 中 率 HR 


和 虚报 率 FAR 转化 为 z 分 数 : 
ZHR = © 1(HR|y = 0,0 = 1) (19) 


zFAR = ®-1(FAR|y = 0,0 = 1) (20) 


公式 (19) 和 (20) 中 ，@-ip|n=0,0= 1) 代 表 均 值 为 0、 标 准 差 为 1 的 标准 正 态 分 布 累积 分 


布 函数 的 逆 函 数 ， 即 将 取 值 范围 在 0 到 1 之 间 的 概率 值 p 转化 为 取 值 范围 在 负 无 穷 到 正 无 


穷 之 间 的 z 分 数 。 随 后 ， 以 zFAR 为 横 坐 标 ，zHR 为 纵 坐 标 ， 绘 制 二 者 之 间 的 关系 图 ， 即 为 


ZROC 曲线 。 图 6 给 出 了 zROC 曲线 的 示例 。 当 zROC 曲线 位 于 直线 了 = x 的 上 方 时 ， 就 意 


味 着 击 中 率 大 于 虚报 率 。 从 数学 上 可 以 证 明 , 在 经 典 信号 检测 论 框架 下 ，zHR 和 zFAR 之 间 
16 


chinaXiv:202205.00114v2 


的 关系 为 一 条 直线 ， 其 斜率 等 于 噪音 分 布 标准 差 和 信和 号 分 布 标准 差 的 比值 on/os (Wickens, 


2001)。 在 信号 检测 论 中 ， 噪 音 分 布 标准 差 on 通常 设 为 1。 当 信和 号 分 布 标准 差 cs 大 于 1 时 ， 


ZROC 直线 的 斜率 小 于 1， 此 时 zROC 直线 必然 会 在 右 侧 与 直线 y=x 相交 ， 并 导致 当 击 中 率 


和 虚报 率 的 值 均 很 大 时 ， 击 中 率 小 于 虚报 率 。 同 理 ， 当 os 小 于 1 时 ，zROC 直线 的 斜率 大 于 


1， 会 在 左 侧 与 ?=x 相交 ， 并 导致 当 击 中 率 和 虚报 率 的 值 均 很 小 时 ， 击 中 率 小 于 虚报 率 《〈 见 


图 6A 的 示例 )。 另 一 方面 ， 在 贝 叶 斯 决策 理论 的 框架 下 ，zHR 和 zFAR 之 间 的 关系 为 一 条 


曲线 ; 无 论 cs 的 值 等 于 多 少 , zROC 曲线 始终 位 于 y=x 的 上 方 ( 见 图 6B 的 示例 ) (Macmillan 


& Creelman, 2004). 
(A) 经 典 信号 检测 论 (B) 贝 叶 斯 决策 理论 
a y=x e y=x 


= — @=1,6,=2 
-- d’=0.5,6,=0.5 


2 
-- d’=0.5,6,=0.5 


-1 


zFAR git 


图 6 zROC 曲线 示例 


由 于 在 不 等 方差 信号 检测 模型 中 ， 经 典 信 号 检测 论 和 贝 叶 斯 决策 理论 预测 了 不 同 的 


ROC 曲线 和 zROC 曲线 形态 ， 因 此 从 理论 上 讲 ， 可 以 通过 考察 实际 研究 当中 获得 的 ROC 以 


及 zROC 曲线 , 以 及 在 极端 条 件 下 获得 的 击 中 率 和 虚报 率 数据 , 来 确认 哪 一 种 理论 能 够 更 好 


地 解释 真实 被 试 在 不 等 方差 信号 检测 任务 当中 的 决策 过 程 。 比 如 ,在 再 认 记 忆 任 务 中 ,可 以 


考虑 通过 尽 可 能 地 增加 旧 词 的 出 现 频率 , 降低 新 词 的 出 现 频率 , 使 得 被 试 设置 尽 可 能 宽松 的 


报告 标准 ， 即 将 绝 大 多 数 刺 激 都 判断 为 旧 词 〈 此 时 击 中 率 和 虚报 率 都 接近 于 1)。 在 该 实验 


条 件 下 ， 如 果 发 现 被 试 的 击 中 率 低 于 虚报 率 ， 则 支持 经 典 信号 检测 论 ， 如 果 击 中 率 始终 高 于 


虚报 率 ， 则 支持 贝 叶 斯 决策 理论 。 
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然而 , 上 述 的 实验 设计 很 难 在 实际 研究 中 得 到 应 用 。 这 是 因为 在 经 典 信号 检测 论 


当 不 等 方差 信号 检测 模 


端 值 0 或 1。 同 时 ， 即 使 存在 击 中 率 低 于 虚报 率 的 情况 ， 二 者 之 间 的 差异 也 是 很 小 的 〈 见 图 


[HI 


架 下 ， 


型 中 的 击 中 率 低 于 虚报 率 时 , 击 中 率 与 虚报 率 的 真 值 都 非常 接近 于 极 


5B 和 图 5C)。 在 此 情况 下 ， 样 本 数据 中 计算 得 到 的 击 中 率 与 虚报 率 差 值 会 受到 抽样 误差 的 


严重 影响 , 一 点 细微 的 抽样 误差 的 存在 都 会 导致 研究 者 难以 根据 实验 结果 准确 估计 击 中 率 与 


虚报 率 的 真实 差异 (Glanzer etal., 2019; Macmillan & Creelman, 2004)。 那 么 ， 是 否 存在 某 种 实 


验 设 计 , 使 得 研究 者 可 以 比较 经 典 信号 检测 论 和 贝 叶 斯 决策 理论 在 解释 真实 个 体 的 决策 过 程 


时 的 优 务 呢 ? 


5 ”支持 贝 叶 斯 决策 理论 的 研究 证 据 


有 研究 者 指出 ， 两 条 件 (two-conditiom) 实 验 可 以 被 用 于 比较 经 典 信号 检测 论 和 贝 叶 斯 决 


策 理论 在 真实 决策 过 程 中 的 合理 性 (Glanzer et al., 2009, 2019; Semmler et al., 2018; Stretch & 


Wixted, 1998)。 所 谓 的 两 条 件 实验 ， 指 的 是 在 一 个 被 试 内 实验 设计 中 ， 要 求 同 一 批 被 试 完成 


两 个 不 同 的 信号 检测 任务 ; 这 两 个 任务 除了 存在 难度 上 的 区 别 外 , 在 任务 要 求 上 没有 任何 差 


异 。 比 如 , 被 试 可 以 完成 两 个 不 同 的 再 认 记 忆 任 务 , 这 两 个 任务 的 唯一 区 别 在 于 学 习 阶 段 被 


试 学 习 每 个 旧 词 的 时 间 长 度 存在 差异 ， 学 习 时 间 越 长 则 任务 难度 越 低 (Glanzer et al., 2009)。 


同时 ,在 两 个 信号 检测 任务 中 ,被 试 不 仅 需要 判断 每 个 刺激 是 信号 还 是 噪音 ,而且 需要 给 出 


自己 对 作答 结果 的 信心 判断 (confidence rating)， 即 被 试 需要 在 一 个 李 克 特 量 表 上 评价 自己 对 


作答 结果 的 信心 程度 如 何 。 此 外 ，Glanzer 等 人 (2019) 指 出 ,在 两 条 件 实验 设计 中 ,被 试 必须 


不 同 的 组 块 (block) 中 进 


的 信号 检测 任务 的 trial 


清楚 意识 到 每 个 trial 来 自 哪个 任务 难度 条 件 。 因 此 ， 两 个 不 同 难度 的 信号 检测 任务 最 好 在 


行 ; 如 果 一 定 要 使 用 混合 列表 设计 (mixed-list design)， 即 把 两 个 难度 


混合 在 一 起 ， 则 必须 通过 特定 的 提示 告知 被 试 当前 的 trial 来 自 哪个 
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实验 条 件 ， 比 如 为 屏幕 上 呈现 的 词语 标注 不 同 的 颜色 等 。 


研究 者 们 提出 了 似 然 比 理论 (likelihood ratio theory) 来 解释 个 体 在 两 条 件 实验 中 的 决策 过 


程 (Glanzer et al., 2009, 2019; Semmler et al., 2018)。 似 然 比 理论 


含 两 个 具体 假设 :〈1) 似 然 比 不 变 假设 。 该 假设 认为 ， 在 两 和 


以 贝 叶 斯 决策 理论 为 基础 ， 包 


不 同 难度 的 实验 条 件 下 ， 个 体 


用 于 贝 叶 斯 决策 过 程 的 似 然 函数 比值 的 临界 值 保持 不 变 ( 这 一 假设 会 在 下 面 进行 更 详细 的 介 


绍 )。(2) 真实 似 然 比 假设 。 该 假设 认为 ， 个 体 知 道 信号 和 噪音 分 布 的 真实 分 布 形态 ， 并 会 


依据 刺激 强度 在 信号 和 噪音 分 布 中 的 真实 似 然 函数 比值 来 完成 决策 过 程 。 需 要 注意 的 是 , 真 


实 似 然 比 假设 是 比 一 般 的 贝 叶 斯 决策 理论 更 强 的 理论 假设 : 贝 叶 斯 决策 理论 通常 允许 个 体 主 


观 估计 的 似 然 函数 比值 与 真实 的 似 然 函 数 比 值 存在 差异 (Lau, 2007; Wickens, 2001)， 但 真实 


似 然 比 假设 则 认为 个 体 知 道 〈 或 至 少 近 似 知道 ) 信和 号 与 噪音 分 布 中 的 真实 似 然 函数 (Glanzer 


et al., 2019; Semmler et al., 2018)。 根 据 似 然 比 理论 ， 个 体 在 两 条 件 实验 中 的 决策 过 程 应 同时 


满足 上 述 两 个 假设 (Glanzer et al., 2009, 2019). 


在 似 然 比 理论 的 基础 上 ，Glanzer 等 人 (2009, 2019) 预 测 了 两 条 件 实验 中 可 能 出 现 的 三 种 


实验 现象 ， 包 括 镜像 效应 (mirror effect)、 方 差 效 应 (variance effect) 和 zROC 长 度 效应 (zROC 


length effect). Glanzer 等 人 指出 ， 似 然 比 理论 可 以 很 容易 地 解释 上 述 三 种 现象 的 产生 机 秆 


一 


s 


但 经 典 信号 检测 理论 难以 同时 解释 这 三 种 现象 的 发 生 。 实际 研究 结果 表明 , 在 不 同 认 知 领域 


= 


《如 知觉 、 记 忆 、 推 理 、 心 理 旋 转 等 ) 的 信号 检测 任务 中 ， 上述 三 种 现象 均 稳定 存在 (Glanzer 


et al., 2009, 2019; Hilford et al., 2015, 2019; Semmler et al., 2018)， 即 在 一 定 程度 上 支持 了 贝 叶 


斯 决策 理论 的 合理 性 。 由 于 篇 幅 所 限 , 本 文 只 着 重 介绍 其 中 的 一 种 现象 一 一 ZROC 长 度 效 应 。 


ZROC 长 度 效 应 最 早 由 Stretch 和 Wixted (1998) 发 现 。Stretch 和 Wixted 对 已 有 的 一 项 研 


究 中 的 数据 进行 了 再 次 分 析 (Ratcliff et al., 1994); 在 该 研究 中 ， 被 试 需要 完成 两 种 不 同 难度 


的 再 认 记 忆 任务 《容易 vs. 困 难 )。 比 如 ， 在 容易 条 件 下 被 试 学 习 每 个 旧 词 的 时 间 为 3 s， 而 
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在 困难 条 件 下 每 个 旧 词 的 学 习 时 间 只 有 1 s。 在 再 认 测 验 中 ， 被 试 需要 在 一 个 6 点 量 表 上 针 


对 每 个 词语 完成 判断 任务 ， 其 中 1 到 6 分 别人 代表“ 确定 是 新 词 ”、“ 很 可 能 是 新 词 ””“ 可 能 是 


新 词 ”“ 可 能 是 旧 词 “很 可 能 是 旧 词 ”“ 确 定 是 旧 词 ”。 因 此， 被 试 不 仅 需 要 针对 每 个 词 


语 进 行 新 旧 判 断 ， 还 需要 报告 自己 对 作答 结果 的 信心 程度 。 在 经 典 信号 检测 论 框架 下 ,信心 


判断 任务 是 二 分 判断 任务 (信号 vs. 噪 音 ) 的 推广 形式 ， 即 在 n 点 量 表 上 进行 的 信心 判断 任 


3 


务 等 价 于 在 刺激 强度 的 数 轴 上 设置 (n-1) 个 报告 标准 (Wickens, 2001). WE 7A 所 示 ， 当 刺激 


强度 低 于 第 一 个 报告 标准 C1 时 ,被 试 会 在 信心 判断 量 表 上 报告 为 1; 当 刺 激 强 度 在 C 和 Co 


之 间 时 ， 被 试 会 在 信心 判断 量 表 上 报告 为 2， 以 此 类 推 。Stretch 和 Wixted 发 现 ， 与 困难 条 


件 (辨别 力 指 数 d 更 低 的 条 件 ) 相 比 ， 在 容易 条 件 〈d' 更 高 的 条 件 ) 下 ， 所 有 的 报告 标准 的 


位 置 均 会 向 中 间 收 缩 ， 即 不 同 报告 标准 之 间 的 距离 会 缩短 《〈 见 图 7A)。Stretch 和 Wixted 随 


后 在 一 个 新 的 实验 研究 中 验证 了 上 述 结论 。 


(A) (B) 


Ci CaC3C4Cs HR 
Z = 
H y=x 
2 > 


Ci C C3 C4 Cs 


困难 条 件 。 XN” 
ANI 


图 7 zROC 长 度 效应 示例 


Glanzer 等 人 (2009, 2019) 使 用 zROC 曲线 对 Stretch 和 Wixted (1998) 报 告 的 现象 进行 了 


重新 表述 。 具 体 而 言 ，Glanzer 等 人 首先 根据 被 试 在 n 点 信心 判断 量 表 上 给 出 的 判断 结果 ， 


通过 改变 报告 标准 的 方式 计算 出 (4-1) 对 击 中 率 和 虚报 率 。 比 如 ， 在 一 个 6 点 信心 判断 量 表 


E, 假设 将 信心 判断 量 表 点 数 1 视 为 被 试 把 当前 刺激 判断 为 噪音 ， 而 将 量 表 点 数 2-6 视 为 被 


试 把 刺激 判断 为 信号 ， 即 可 计算 出 一 组 击 中 率 和 虚报 率 ; 而 如 果 将 量 表 点 数 1-2 视 为 被 试 把 
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刺激 判断 为 噪音 ， 而 将 量 表 点 数 3-6 视 为 被 试 把 刺激 判断 为 信号 ， 则 可 计算 出 另 一 组 击 中 率 


和 虚报 率 ; 以 此 类 推 。 随 后 ，Glanzer 等 人 基于 每 种 实验 条 件 下 获得 的 (n-1) 对 击 中 率 和 虚报 


率 绘制 出 ZROC 曲线 。 结 果 表 明 , 与 困难 条 件 相 比 ; 容易 条 件 下 绘制 的 ZROC 曲线 两 端 之 间 


的 距离 显著 更 短 (如 图 7B 所 示 ); 这 意味 着 当 改 变 报 告 标准 时 , 容易 条 件 下 的 击 中 率 和 虚报 


率 值 变 化 幅度 更 小 ， 即 说 明 容易 条 件 下 不 同 的 报告 标准 之 间 更 为 接近 。Glanzer 等 人 将 这 一 


现象 命名 为 ROC 长 度 效 应 。 


似 然 比 理论 指出 , 基于 似 然 比 不 变 假设 可 以 很 自然 地 推导 出 zROC 长 度 效应 。 根据 贝 叶 


斯 决策 理论 (参考 公式 (8))， 个 体 在 n 点 信心 判断 量 表 上 给 出 判断 的 过 程 ， 可 以 被 看 作 是 在 


后 验 概率 比值 上 设置 (n-1) 个 六 值 ( 记 为 BJ、B2……B1)， 并 将 当前 刺激 对 应 的 后 验 概率 比值 


与 每 个 p 值 相 比较 的 过 程 。 假 如 当前 刺激 对 应 的 后 验 概率 比值 小 于 B!， 则 个 体 在 信心 判断 


量 表 上 报告 的 结果 为 1; 假如 刺激 对 应 的 后 验 概 率 比 值 在 Bi 和 Bz 之 间 ， 则 信心 判断 的 结 


为 2; 以 此 类 推 (Green & Swets, 1966). Glanzer 等 人 (2009, 2019) 假 设 ， 当 两 个 实验 条 件 之 间 


的 唯一 差异 为 任务 难度 时 , MACE AY BEL B 应 当 不 会 在 实验 条 件 之 间 发 生 改 变 。 由 于 后 验 


概率 比值 等 于 先 验 概率 比值 和 似 然 函数 比值 的 乘积 , 且 个 体 在 贝 叶 斯 推理 过 程 中 对 于 信号 和 


噪音 出 现 的 先 验 概率 的 主观 估计 通常 可 以 近似 视 为 恒定 (Fleming & Daw, 2017; Wickens, 


2001)， 因 此 可 以 在 数学 上 等 价 地 认为 ， 个 体 在 信号 和 噪音 分 布 的 似 然 函 数 比值 上 设置 了 一 


组 阀 值 ， 并 通过 每 个 刺激 对 应 的 似 然 函 数 比 值 与 上 述 阔 值 之 间 的 比较 来 给 出 信心 判断 的 结 


果 ; 同时 , 个体 在 似 然 函数 比值 上 设置 的 冰 值 应 当 不 会 在 两 个 实验 条 件 之 间 发 生变 化 (Glanzer 


et al., 2019)。 上 述 假设 即 为 似 然 比 不 变 假设 。 


BERR, 本 文 将 以 等 方差 信号 检测 模型 为 例 , 根据 似 然 比 不 变 假设 来 推导 ZROC 长 度 效 


应 。 由 于 个 体 在 似 然 函 数 比 值 上 设置 的 闵 值 是 恒定 不 变 的 , 因此 在 为 似 然 函 数 比 值 取 对 数 之 


E, HZA O 上 设置 的 六 值 也 不 会 在 实验 条 件 之 间 发 生 改变 。 基 于 正 态 分 布 的 概率 
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密度 函数 (参考 公式 (14) 和 (15))， 可 以 写 出 与 报告 标准 C 之 间 的 对 应 关系 (Glanzer et al., 


2009): 
pClu=d,o=D] n d? 
1= ln = (21) 
A d 
C= 一 圭一 22 
rae (22) 


当 入 在 不 同 实验 条 件 之 间 维 持 恒 定时 ， 随 着 任务 难度 的 下 降 〈 即 ?的 上 升 )， 报 告 标准 


C 会 逐渐 向 d72 的 周转 


收缩 ,因此 一 组 报告 标准 之 间 的 距离 会 缩短 ,， 即 得 出 了 zROC 长 度 效 


应 。 此 外 ，Glanzer 等 人 (2009) 的 数学 # 


的 贝 叶 斯 决策 机 制 更 为 复杂 ， 但 只 


效应 就 会 成 立 。Glanzer 等 人 (2009, 20 


要 个 体 保持 在 不 同 实验 条 件 之 间 的 恒定 ， 


zx | 


主导 结果 表明 ， 在 不 等 方差 信号 检测 模型 中 ， 虽 然 个 体 
ZROC 长 度 


19) 指 出 ， 虽 然 经 典 信号 检测 论 也 可 以 对 ZROC 长 度 效 


应 进行 强行 解释 , 即 认为 个 体 在 刺激 强度 的 数 轴 


上 直接 设置 的 报告 标准 恰好 随 着 任务 难度 的 


降低 而 收缩 ， 但 它 无 法 解释 报告 标准 的 收缩 对 应 怎样 的 内 在 心理 机 制 。 因 此 ，zROC 长 度 效 


应 可 以 被 视 为 是 支持 贝 叶 斯 决策 理论 的 证 据 。 基于 相似 的 方法 ,， Glanzer 等 人 (2009) 从 似 然 比 


理论 中 推导 出 了 另外 两 种 现象 一 一 镜像 效应 和 方差 效应 , 并 在 实际 研究 结果 中 验证 了 这 两 种 
效应 的 存在 。 感 兴趣 的 读者 可 以 阅读 Glanzer 等 人 (2009) 的 数学 推导 过 程 。 


根据 似 然 比 理论 得 出 的 三 种 实验 现象 在 一 定 程度 上 为 贝 叶 斯 决策 理论 提供 了 支持 。 然 而 ， 


似 然 比 理论 一 直 受 人 质疑 的 地 方 在 于 其 包含 的 真实 似 然 比 假设 , 即 认为 个 体 在 信号 检测 任务 


中 能 够 知道 信号 和 噪音 分 布 的 真实 


a 
BAS 。 


些 研 究 者 质疑 真实 被 试 是 否 有 能 力 掌握 如 此 多 的 


信息 (Balakrishnan & Ratcliff, 1996; Criss & McClelland, 2006)。 为 了 回应 这 一 质疑 ，Semmler 


普 分 布 形态 的 认识 来 自 于 日 常生 活 中 经 年 累 月 的 学 习 ， 即 


等 人 (2018) 提 出 ， 个 体 对 信号 和 品 


使 个 体 不 能 通过 学 习 来 完全 精确 地 掌握 信号 与 噪音 分 布 的 均值 与 标准 差 , 也 至 少 可 以 清楚 地 


意识 到 信号 和 噪音 分 布 之 间 的 距离 如 何 随 着 任务 难度 的 变化 而 发 生变 化 (Tumer et al., 2011; 


Wixted & Gaitan, 2002)。 然 而 ， 上 述 观点 目前 仍 主要 停留 在 理论 层面 。 未 来 需要 进一步 研究 
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对 似 然 比 理论 的 假设 合理 性 


& 

D 
ak 
R 


6 ”结语 


本 文 在 贝 叶 斯 决策 理论 的 框架 下 , 探讨 了 个 体 如 何 通过 贝 叶 斯 推理 过 程 完 成 信号 检测 任 


务 中 的 决策 判断 。 与 经 典 信 号 检测 论 相 比 ， 贝 叶 斯 决策 理论 可 以 更 加 深入 地 解释 个 体 辨 别 信 


号 和 噪音 的 决策 过 程 对 应 怎样 的 内 在 心理 机 制 。 但 是 ， 贝 叶 斯 决策 理论 中 涉及 的 参数 较 多 


(包括 个 体 对 先 验 概率 和 似 然 函 数 的 主观 估计 )， 而 在 信号 检测 实验 任务 中 ， 根 据 击 中 率 和 


虚报 率 的 实验 数据 难以 对 上 述 的 所 有 参数 进行 求解 。 比 如 , 个 体 在 信号 检测 任务 中 的 报告 标 


准 发 生变 化 , 既 有 可 能 是 源 于 个 体 改 变 了 对 先 验 概率 的 主观 估计 ， 


也 可 能 是 由 于 对 似 然 函 数 


的 主观 估计 发 生 改 变 ， 而 在 实际 研究 中 很 难 对 上 述 两 种 情况 进行 区 分 (Fleming & Daw, 2017; 


Lau, 2007)。 虽然 似 然 比 理论 认为 个 体 对 似 然 函 数 的 主观 估计 和 客观 真实 值 基 本 相同 (Glanzer 


et al., 2009, 2019; Semmler et al., 2018)， 即 对 贝 叶 斯 决策 理论 进行 了 简化 ， 但 这 一 假设 受到 


了 其 他 研究 者 的 质疑 。 因此 , 本 文 认为 , 在 实际 的 信号 检测 实验 任务 中 , 经 典 信号 检测 论 (以 


ia 


及 该 理论 提出 的 报告 标准 C) 依然 是 可 用 于 数据 分 析 的 有 


Sa 


MTA. 


本 文 讨论 的 贝 叶 斯 决策 理论 并 不 能 完整 反映 个 体 在 信号 检测 任务 中 的 决策 机 制 。 比 如 ， 


贝 叶 斯 决策 理论 认为 , 个 体 的 决策 结果 完全 基于 信号 和 噪音 出 现 的 后 验 概 率 的 比值 ， 当 信和 号 


的 后 验 概 率 大 于 噪音 时 , 被 试 会 将 当前 刺激 判断 为 信号 , 反之 则 判断 为 噪音 (Burgess, 1985). 


然而 , 在 实际 研究 中 ,被 试 的 决策 结果 还 会 受到 与 任务 相关 的 奖励 及 惩罚 程度 的 影响 ,比如 ， 


一 名 司机 在 驾驶 汽车 即将 到 达 十 字 路 口 时 , 需要 快速 判断 前 方 的 红绿灯 上 目前 显示 的 是 哪 种 


颜色 〈 这 里 定义 绿灯 为 信号 ， 红 灯 为 噪音 )。 在 上 述 的 知觉 判断 任务 中 ， 漏 报 〈 即 将 绿灯 判 


断 为 红 灯 〉 并 不 会 产生 非常 严重 的 后 果 ， 只 会 导致 司机 在 十 字 路 


站 多 等 待 一 段 时 间 。 然 而 ， 


虚报 (将 红 灯 判 断 为 绿灯 〉 则 会 造成 严重 危害 ,比如 司机 阁 红 灯 撞 到 绿灯 方向 通行 的 汽车 或 
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行人 。 因此, 司机 可 能 会 采取 非常 严格 的 报告 标准 ， 即 倾向 于 将 红绿灯 上 显示 的 颜色 判断 为 


红色 (噪音 ), 而 这 一 判别 标准 与 司机 实际 接收 的 知觉 信息 (刺激 强度 ) 是 相互 独立 的 。Green 


和 Swets (1966) 指 出 ， 当 不 同 作答 结果 的 奖励 或 惩 神 程度 不 同时 ， 个 体 的 作答 目标 可 能 会 从 


最 大 化 作答 正确 率 ( 即 理想 观察 者 )， 转 变 为 最 大 化 自身 获得 的 奖励 或 最 小 化 自身 所 受 的 您 


罚 。 此 时 ,个 体 的 最 终 决 策 会 同时 基于 信号 和 噪音 成 立 的 后 验 概率 ， 以 及 不 同 的 作答 反应 可 


能 导致 的 后 果 。 


前 文 提 到 ， 贝 叶 斯 决策 理论 认为 , 个 体 在 信号 检测 任务 中 给 出 信心 判断 的 过 程 ， 可 以 被 


视 为 是 在 后 验 概率 比值 上 设置 一 组 不 同 的 阀 限 , 并 将 当前 刺激 对 应 的 后 验 概率 比值 与 每 个 阐 


限 值 相 比较 的 过 程 (Glanzer et al., 2009, 2019; Green & Swets, 1966)。 然 而 ， 近 年 来 ， 研 究 者 


逐渐 认识 到 , 基于 刺激 强度 推理 得 到 的 后 验 概 率 并 不 能 准确 地 反映 个 体 的 信心 判断 结果 。 这 


是 因为 个 体 在 决策 当前 刺激 是 信号 还 是 噪音 时 依赖 的 刺激 强度 , 与 信心 判断 过 程 中 使 用 的 信 


息 可 能 并 不 完全 相同 : 个 体 在 信心 判断 中 可 能 会 丢失 一 部 分 关于 刺激 内 容 的 信息 , 也 可 能 基 


于 一 些 额外 的 推理 过 程 获得 更 丰富 的 信息 (Hu et al., 2021; Jang et al., 2012; Maniscalco & Lau, 


2012; Shekhar & Rahnev, 2021)。 为 了 将 信心 判断 过 程 更 好 地 纳入 到 贝 叶 斯 决策 理论 的 框架 


F, Fleming 和 Daw (2017) 对 传统 的 贝 叶 斯 决策 理论 进行 了 改进 ， 并 在 改进 后 的 理论 中 考 


虑 了 个 体 在 决策 过 程 和 信心 判断 过 程 中 利用 信息 的 差异 。 但是， 男 一 些 研究 者 认为 ,即使 考 


虑 了 个 体 在 信心 判断 过 程 中 利用 的 独特 信息 , 信心 判断 过 程 自身 的 内 在 机 制 可 能 也 与 贝 叶 斯 


决策 理论 的 观点 并 不 完全 相符 (Adler & Ma, 2018; Li & Ma, 2020)。 关 于 信心 判断 对 应 的 内 在 


心理 过 程 是 否 为 贝 叶 斯 决策 过 程 ， 目 前 仍然 是 一 个 存在 争论 的 话题 ， 需 要 未 来 研究 的 进一步 


24 


参考 文献 


AAEM, FLEW, Wagenmakers, E.-J., Ly, A, WLF. (2018)， 贝 叶 斯 因子 及 其 在 JASP 中 的 实现 . 


DEF FIFE, 26(6), 951-965. 


Adler, W. T., & Ma, W. J. (2018). Comparing Bayesian and non-Bayesian accounts of human 


confidence reports. PLoS Computational Biology, 14(11), e1006572. 


Balakrishnan, J. D., & Ratcliff, R. (1996). Testing models of decision making using confidence ratings 


in classification. Journal of Experimental Psychology: Human Perception and Performance, 


22(3), 615-633. 


Banks, W. P. (1970). Signal detection theory and human memory. Psychological Bulletin, 74(2), 81— 


99. 


Burgess, A. (1985). Visual signal detection.II.On Bayesian use of prior knowledge and cross 


correlation. Journal of the Optical Society of America A, 2(9), 1498—1507. 


Criss, A. H., & McClelland, J. L. (2006). Differentiating the differentiation models: A comparison of 


the retrieving effectively from memory model (REM) and the subjective likelihood model 


(SLiM). Journal of Memory and Language, 55(4), 447-460. 


Egan, J., Schulman, A. I., & Greenberg, G. Z. (1959). Operating characteristics determined by binary 


decisions and by ratings. The Journal of the Acoustical Society of America, 31(6), 768-773. 


Fleming, S. M., & Daw, N. D. (2017). Self-evaluation of decision-making: A general bayesian 


framework for metacognitive computation. Psychological Review, 124(1), 91-114. 


Glanzer, M., Hilford, A., Kim, K., & Maloney, L. T. (2019). Generality of likelihood ratio decisions. 


Cognition, 191, 103931. 


Glanzer, M., Hilford, A., & Maloney, L. T. (2009). Likelihood ratio decisions in memory: Three 


25 


implied regularities. Psychonomic Bulletin & Review, 16(3), 431-455. 


Green, D. M., & Swets, J. A. (1966). Signal detection theory and psychophysics. Wiley. 


Hilford, A., Glanzer, M., Kim, K., & Maloney, L. T. (2019). One mirror effect: The regularities of 


recognition memory. Memory & Cognition, 47(2), 266-278. 


Hilford, A., Maloney, L. T., Glanzer, M., & Kim, K. (2015). Three regularities of recognition memory: 


the role of bias. Psychonomic Bulletin & Review, 22(6), 1646—1664. 


Hu, X., Zheng, J., Su, N., Fan, T., Yang, C., Yin, Y., Fleming, S. M., & Luo, L. (2021). A Bayesian 


inference model for metamemory. Psychological Review, 128(5), 824—855. 


Jang, Y., Wallsten, T. S., & Huber, D. E. (2012). A stochastic detection and retrieval model for the 


study of metacognition. Psychological Review, 119(1), 186—200. 


Kersten, D., Mamassian, P., & Yuille, A. (2004). Object Perception as Bayesian Inference. Annual 


Review of Psychology, 55(1), 271-304. 


Knill, D. C. (1998). Discrimination of planar surface slant from texture: human and ideal observers 


compared. Vision Research, 38(11), 1683-1711. 


Lau, H. C. (2007). A higher order Bayesian decision theory of consciousness. Progress in Brain 


Research, 168, 35-48. 


Legge, G. E., Hooven, T. A., Klitz, T. S., Stephen Mansfield, J., & Tjan, B. S. (2002). Mr. Chips 2002: 


new insights from an ideal-observer model of reading. Vision Research, 42(18), 2219-2234. 


Li, H.-H., & Ma, W. J. (2020). Confidence reports in decision-making with multiple alternatives 


violate the Bayesian confidence hypothesis. Nature Communications, 11(1), 2004. 


Macmillan, N. A., & Creelman, C. D. (2004). Detection theory: A user’s guide. London: Psychology 


press. 


26 


Maloney, L. T., & Zhang, H. (2010). Decision-theoretic models of visual perception and action. Vision 


Research, 50(23), 2362—2374. 


Mamassian, P. (2016). Visual confidence. Annual Review of Vision Science, 2(1), 459-481. 


Maniscalco, B., & Lau, H. (2012). A signal detection theoretic approach for estimating metacognitive 


sensitivity from confidence ratings. Consciousness and Cognition, 21(1), 422—430. 


Mickes, L., Wixted, J. T., & Wais, P. E. (2007). A direct test of the unequal-variance signal detection 


model of recognition memory. Psychonomic Bulletin & Review, 14(5), 858—865. 


Pouget, A., Drugowitsch, J., & Kepecs, A. (2016). Confidence and certainty: Distinct probabilistic 


quantities for different goals. Nature Neuroscience, 19(3), 366—374. 


Ratcliff, R., McKoon, G., & Tindall, M. (1994). Empirical generality of data from recognition memory 


receiver-operating characteristic functions and implications for the global memory models. 


Journal of Experimental Psychology: Learning, Memory, and Cognition, 20(4), 763-785. 


Rotello, C. M. (2017). Signal Detection Theories of Recognition Memory. In J. Byrne (Ed.), Learning 


and Memory: A Comprehensive Reference (Second Edition) (pp. 201-225). Academic Press. 


Semmler, C., Dunn, J., Mickes, L., & Wixted, J. T. (2018). The role of estimator variables in 


eyewitness identification. Journal of Experimental Psychology: Applied, 24(3), 400-415. 


Shekhar, M., & Rahnev, D. (2021). The nature of metacognitive inefficiency in perceptual decision 


making. Psychological Review, 128(1), 45—70. 


Stretch, V., & Wixted, J. T. (1998). Decision rules for recognition memory confidence judgments. 


Journal of Experimental Psychology: Learning, Memory, and Cognition, 24(6), 1397-1410. 


Tanner, W. P., & Swets, J. A. (1954). A decision-making theory of visual detection. Psychological 


Review, 61(6), 401—409. 


27 


202205.00114v2 


chinaXiv 


Turner, B. M., Van Zandt, T., & Brown, S. (2011). A dynamic stimulus-driven model of signal 


detection. Psychological Review, 118(4), 583-613. 


Wickens, T. D. (2001). Elementary signal detection theory. New York: Oxford university press. 


Wixted, J. T. (2007). Dual-process theory and signal-detection theory of recognition memory. 


Psychological Review, 114(1), 152-176. 


Wixted, J. T. (2020). The forgotten history of signal detection theory. Journal of Experimental 


Psychology: Learning, Memory, and Cognition, 46(2), 201-233. 


Wixted, J. T., & Gaitan, S. C. (2002). Cognitive theories as reinforcement history surrogates: The case 


of likelihood ratio models of human recognition memory. Animal Learning & Behavior, 30(4), 


289-305. 


28 


The Relationship Between Signal Detection Theory and Bayesian 


Decision Theory 


HU Xiao 


(Faculty of Psychology, Beijing Normal University, Beijing 100875) 


Abstract: Signal detection theory (SDT) has been widely applied to explain the decision-making 
process in different types of cognitive tasks. However, one important limitation of classical SDT is 
that it is difficult to illustrate the mental mechanisms underlying the setting of response criterion. 
The current article discusses the decision rule in signal detection tasks from the perspective of 
Bayesian decision theory (BDT). I first introduce the basic idea of BDT based on the Bayes’ 
theorem. Next, I discuss how BDT explains the decision rule of ideal observer, and characterizes 
the deviation between actual participants and ideal observer in empirical signal detection tasks. I 
then discuss the difference between classical SDT and BDT in unequal variance signal detection 
model. Finally, I briefly introduce the empirical research evidence supporting BDT. 

Key words: signal detection theory; Bayesian decision theory; prior probability; likelihood 


function; response criterion 
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